智能论文笔记

BITS Pilani at HinglishEval: Quality Evaluation for Code-Mixed Hinglish Text Using Transformers

Shaz Furniturewala , Vijay Kumari , Amulya Ratna Dash , Hriday Kedia , Yashvardhan Sharma

分类：自然语言处理 | 机器学习

2022-06-17

代码混合的文本数据包括带有来自多种语言的单词或短语的句子。全世界大多数多种语言社区都使用多种语言进行交流，而英语通常是其中之一。Hinglish是由印地语和英语组成的代码混合文本，但用罗马脚本编写。本文旨在确定影响系统生成的代码混合文本数据质量的因素。对于Hinglisheval任务，提出的模型使用多语言BERT来找到合成生成和人类生成的句子之间的相似性，以预测合成生成的hinglish句子的质量。

translated by 谷歌翻译

相关文章
笔记